فیلتر صفحات وب با استفاده از آنتولوژی و ابزارهای وب معنایی

پایان نامه
چکیده

در سال های اخیر، تکنیک های فیلتر محتوایی دانش محور مبتنی بر پایگاه دانش و آنتولوژی به روش هایی کارا و قابل قبول برای فیلتر اطلاعات تبدیل شده اند. در این تحقیق از ساختار آنتولوژی و پایگاه دانش های ویکی پدیا، وردنت و bnc برای عمل فیلتر اسناد، بهبود نمایش اولویت های کاربری و محتوای اسناد و محاسبه شباهت معنایی استفاده می شود. همچنین سامان دهی علایق کاربری و محتوای اسناد در پروفایل ها امکان استخراج دانش درباره ی علایق احتمالی کاربران و محتوای اسناد را با استفاده از آنتولوژی و پایگاه دانش فراهم می آورد. این تحقیق روشی نوین و منحصر به فرد در ساختار ترکیب خبرگان برای فیلتر اسناد ارائه می کند و مجموعه ای از بهترین و کاراترین روش های فیلتر را پیاده سازی و با هم یکپارچه می کند. ارزیابی سیستم در دو مرحله ارزیابی روش های محاسبه شباهت معنایی و روش های فیلتر محتوایی با استفاده از مجموعه داده های میلر- چارلز و 20newsgroup انجام می شود. نتایج ارزیابی، همبستگی زیاد روش های محاسبه ی شباهت معنایی میان مفاهیم را با قضاوت بشر نشان می دهد. روش مبتنی بر ویکی پدیا با میزان همبستگی 0.779 نه تنها از دیگر روش های پیاده سازی شده بهتر عمل می کند بلکه از روش های مشابه و شناخته شده ای مانند codc با میزان همبستگی 0.693 و روش esa با میزان همبستگی 0.58 بهتر عمل می کند. به علاوه در ارزیابی روش های فیلتر دانش محور ملاحظه می شود که روش مبتنی بر آنتولوژی با نرخ صحت و کارآیی 98.9 و 98 درصد و روش مبتنی بر ویکی پدیا با نرخ صحت و کارآیی 98.2 و 96 درصد نتایج بهتری نسبت به دیگر روش های مشابه و شناخته شده مانند nb-svm hybrid دارند. همچنین نتایج ارزیابی روش مبتنی بر ساختار ترکیب خبرگان با نرخ صحت و کارآیی 99.4 و 98.9 درصد نشان می دهد که این روش نه تنها از تک تک روش های پیاده سازی شده کارآیی و صحت بالاتری دارد، بلکه می تواند خطاهای عمل فیلتر را تصحیح کند. براساس این نتایج، سیستم پیاده سازی شده می تواند به عنوان رویکرد جدیدی در فیلتر محتوایی و به عنوان چارچوبی برای استفاده در کاربردهای فیلتر اطلاعات استفاده شود

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

پیمانه ای کردن آنتولوژی در وب معنایی

ایده اصلی وب معنایی، ایجاد فراداده هایی است که داده را شرح می دهند تا کامپیوترها را قادر به پردازش معنی اشیا کنند. هدف از وب معنایی این است که ماشین ها نیز همانند انسان ها سندها را درک کرده و تفسیر کنند. یکی از مولفه های اصلی وب معنایی، آنتولوژی است، که نسبت به سایر مولفه ها از قدرت بیان بیشتری برخوردار است. آنتولوژی، مجموعه ای از واژگان مشترک را برای محققانی تعریف می کند که نیاز به اشتراک گذار...

15 صفحه اول

مدیریت اطلاعات با استفاده از تکنولوژی وب معنایی

با رشد دنیای وب و تکنولوژیهای مختلف انتشار اطلاعات بیوقفه ادامه پیدا کرد و امروزه مجموعه عظیمی از اطلاعات فراهم آمده است که مدیریت آن به سادگی امکانپذیر نمیباشد همچنین بخش اعظم این اطلاعات تنها توسط انسانها قابل درک و پردازش است و قابل درک توسط ماشینها نیست تکنولوژی وب معنایی با بیان قابلیتهای جدید و قابل فهمکردن محتوا برای ماشین تا حد زیادی مشکلات ناشی از مدیریت دادهها را کاهش داده است استفاده...

متن کامل

خوشه بندی کاربران وب و واکشی اولیه صفحات وب با استفاده از آنالیز معنایی پنهان احتمالاتی

در سالهای اخیر با توجه به رشد سریع وب جهانی، تحقیقات وسیعی پیرامون مدل کردن رفتار پیمایشیِ کاربران در وب¬سایت¬ها انجام گرفته است. در این راستا کاربردکاوی وب با هدف به¬دست آوردن الگوهای رفتار پیمایشی کاربران وب، مورد استفاده بسیاری از محققان قرار گرفته است. به¬طورکلی کاربران وب رفتارهای متفاوتی متناسب با نیازهای اطلاعاتی و وظایف مورد علاقه خود در بازدید از وب¬سایت¬ها از خود نشان می¬دهند، تمامی ر...

15 صفحه اول

نظامهای نوین سازماندهی دانش: وب معنایی، هستی‌شناسی و ابزارهای سازماندهی دانش عینی

دانش و فناوری، از مؤلفه‌های مهم و الزامی برای بقا و حفظ مزیت رقابتی به شمار می‌آیند.  دانش در صورتی می‌تواند مزیت رقابتی ایجاد کند که به صورت بهینه‌ای سازماندهی و قابل بازیابی باشد. ابزارهای سنتی سازماندهی دانش از قبیل طرحهای رده‌بندی، سرعنوانهای موضوعی، اصطلاحنامه‌ها و ... که عمدتاً برای محیط چاپی طراحی شده‌اند، با توجه به تغییرات گسترده فناورانه به شکل الکترونیکی تحول یافته‌اند و تلاش ...

متن کامل

پژوهشی در حکم فقهی فیلتر(شبکه‌های تلویزیونی، صفحات وب و شبکه‌های اجتماعی مجازی)

مقالۀ پیشِ‌رو، پاسخ  این مسئله است: «آیا دلیل فقهی بر جواز یا وجوب فیلتر و مسدود کردن شبکه‌های تلویزیونی، صفحات وب و شبکه‌های اجتماعی مجازی وجود دارد؟ این دلیل یا ادله کدام‌اند؟» براساس این پژوهش و با تکیه بر آرای فقیهان بزرگ می‌توان چنین نتیجه گرفت: اصل اولی، حرمت منع دسترسی دیگران به صفحات اینترنت، شبکه‌های تلویزیونی و شبکه‌های اجتماعی مجازی است و از دلیل حرمت حفظ کتب ضلال نمی‌توان برای وجوب ف...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شهید چمران اهواز - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023